Облегченная система рекомендаций для анализа социальных сетей с использованием гибридного алгоритма классификатора BERT-SVM
Аннотация:
Платформы социальных сетей, такие как Twitter, Instagram и Facebook, способствуют массовому общению и установлению связей. Развитие и продвижение социальных платформ приводит к увеличению распространения фейковых новостей. В настоящее время проведено большое количество исследований для обнаружения фейковых новостей с помощью алгоритмов машинного обучения. Существующие методы определения фейков имеют ряд трудностей: быстрое распространение фейков; различные методы доступа и незначительный выбор признаков, приводящие к невысокой точности классификации текста. Для преодоления данных трудностей предложена Light weight recommendation system for social networking analysis using a hybrid BERT-SVM classifier algorithm Научно-технический вестник информационных технологий, механики и оптики, 2022, том 22, № 4 770 Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2022, vol. 22, no 4 гибридная модель представления двунаправленного кодировщика трансформаторов – метод опорных векторов (BERT-SVM) с системой рекомендаций, которая используется для прогнозирования, является ли информация поддельной или реальной. Предложенная модель включает в себя три этапа: предварительная обработка, выбор признаков и классификация. Набор данных собран из социальных сетей Twitter, связанных с данными о COVID-19 в режиме реального времени. Этап предварительной обработки включает в себя разделение, удаление стоп-слов, лемматизацию и исправление орфографии. Преобразователь обратной частоты документа (TFIDF) использован для извлечения признаков и преобразования текста в двоичные векторы. Гибридная модель классификации BERT-SVM применена для прогнозирования данных, которые сопоставлены с предварительно обработанными данными. Представленная модель реализована в программном пакете MATLAB. Рассчитанные показатели точности продемонстрировали следующие результаты: доля правильных ответов 98 %, ошибка 2 %, точность 99 %, специфичность 99 %, чувствительность 98 %. Полученные результаты показали эффективность предложенной модели по сравнению с существующими подходами. Возможность анализа социальных сетей обеспечивает эффективное предсказание фейковых новостей, которое можно использовать для идентификации комментариев в Twitter, как настоящих, так и поддельных
Ключевые слова:
Постоянный URL
Статьи в номере
- Исследование дисперсионных свойств конгруэнтного кристалла ниобата лития терагерцовом диапазоне частот
- Исследование влияния наведенных механических напряжений, вызванных герметизацией стеклоприпоем, на значение коэффициента поляризационной экстинкции в двулучепреломляющем оптическом волокне
- Метод дистанционного контроля радиационных параметров космических аппаратов на основе рентгенофлуоресцентного анализа
- Волоконно-оптический амплитудный датчик направления и величины изгиба
- Компенсация внешних возмущений для многоканальных систем с запаздыванием в управлении
- Построение криптографических схем, основанных на эллиптических кривых над рациональными числами
- Алгоритм генерации проектных решений для управления данными и проектно-производственными процедурами на этапах жизненного цикла электронного изделия
- Способ повышения эффективности комплексной обработки данных дистанционного зондирования Земли при решении задач мониторинга пространственных объектов
- Разработка модели обнаружения сетевых аномалий трафика в беспроводных распределенных самоорганизующихся сетях
- Применение FN-корректора с целью повышения качества классификации аудиособытий
- Усиление роли микроархитектурных этапов проектирования встраиваемых систем
- Многомерный двоичный классификатор дерева решений на основе неглубокой нейронной сети
- Организация фаззинг-тестирования многопоточных приложений на основе метода распараллеливания независимых переходов
- Метод защиты нейронных сетей от компьютерных бэкдор-атак на основе идентификации триггеров закладок
- Программная инструментальная система создания адаптивных пользовательских интерфейсов
- Метод обнаружения инцидентов информационной безопасности по аномалиям в биометрических поведенческих чертах пользователя
- Моделирование случайных процессов на основе преобразования Карунена–Лоэва
- Управление численной диссипацией гибридного метода крупных частиц в задачах с вихревой неустойчивостью
- Численная модель импульсного подкритического стримерного сверхвысокочастотного разряда для задач плазменного поджига топливных смесей в газовой фазе
- Численное исследование прямой, винтовой и спиральной капиллярной трубок для хладагента CO2
- Восстановление информации в зашумленном канале методом фантомной визуализации со спектральным мультиплексированием в оптическом диапазоне